Здесь приведено выравнивание блока AP endonuclease, сделанное с помощью программы GeneDoc.
Множественное выравнивание блока из базы данных BLOCKS, отвечающего белку END4_ECOLI
ID AP_endnuclease2; BLOCK
AC IPB001719E; distance from previous block=(22,31)
DE AP endonuclease, family 2
BL ELV; width=47; seqs=85; 99.5%=2038; strength=1427
Веб-страница, содержащая блок
Голубым цветом раскрашены столбцы со степенью идентичности более 80%, зеленым цветом более 60%, оранжевым цветом более 40%,
белым цветом менее 40%. Пронумерован каждый пятый остаток.
Вычисление весов аминокислотных замен на основе множественного выравнивания блока AP_endnuclease2 из базы данных BLOCKS
|
В таблице приведены значения количества пар аминокислот
nαβ, частоты встречаемости пар
Pαβ,
средние частоты встречаемости отдельных аминокислот, входящих в пары
qα,qβ, вес замен аминокислот в парах друг на
друга sαβ .
Количество пар было рассчитано с помощью программы pairs_cont.exe,
остальные рассчеты производились по формулам:
Pαβ= ƒα
β / Σα=120 Σβ=1
α ƒαβ,
qα(β)= P
αα(ββ)+ Σα#β Pα
β / 2,
sαβ= 2log2(
Pαβ / qαqβ )
Вычисление весов аминокислотных замен на основе множественных выравниваний 200 блоков из базы данных BLOCKS
|
Эта таблица ничем, кроме значений, не отличается от предыдущей, формулы, по которым производились рассчеты одинаковы. Единственное отличие это гораздо большие значения количества пар, но это и понятно, т.к. рассчеты производились на основе 200 блоков, что в 200 раз больше одного блока :-)
Сравнение весов аминокислотных замен
|
В таблице приведены значения весов аминокислотных замен Met-Met, Met-Val, Met-Asp. Глядя на вес замен, можно оценить вероятность этих замен, то есть на сколько можно верить, что в процессе эволюции произошла именно такая замена. С помощью этих весов можно оценить на сколько гомологичны последовательности: чем больше суммарный вес замен, тем больше вероятность гомологичности последовательностей. В матрице BLOSSUM62 видно, что наибольший вес имеют замены внутри групп похожих аминокислот, а также замены аминокислот на самих себя, а замены между группами намного меньше (средний вес замен внутри группы I L V и F Y W 2, вес замен между группами I L V и F Y W -1.33, замены на самих себя D на D 6, Y на Y 7). Действительно, более вероятно, что окажутся гомологичными аминокислоты из одной группы, чем из разных групп. Значения, полученые с помощью рассчетов на основе одного блока больше отличаются от BLOSSUM62, чем на основе 200 блоков ( в первом случае первые два значения отличаются на 3 единицы, третье на 2, во втором случае первые значения не отличаются, третье отличается на 2 единицы). Такие числа получились потому, что рассчеты проводились на основе разных по "качеству" и объему данных ( в одном блоке меньше выборка, следовательно увеличивается вероятность случайных данных; 200 блоков также намного меньшее кол-во, чем было обработано для построения матрицы BLOSSUM62). Исходя из этого, ясно, что самые правильные данные в BLOSSUM62, затем идут данные на основе 200 блоков; данным на основе AP_endnuclease2 можно верить меньше всего. Не смотря на все различия, везде можно видеть ту же закономерность, что и в BLOSSUM62.
На главную страницу второго семестра